首页> 外文OA文献 >Improving Named Entity Recognition for Chinese Social Media with Word Segmentation Representation Learning
【2h】

Improving Named Entity Recognition for Chinese Social Media with Word Segmentation Representation Learning

机译:用Word改进中文社交媒体的命名实体识别   分段表示学习

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Named entity recognition, and other information extraction tasks, frequentlyuse linguistic features such as part of speech tags or chunkings. For languageswhere word boundaries are not readily identified in text, word segmentation isa key first step to generating features for an NER system. While using wordboundary tags as features are helpful, the signals that aid in identifyingthese boundaries may provide richer information for an NER system. Newstate-of-the-art word segmentation systems use neural models to learnrepresentations for predicting word boundaries. We show that these samerepresentations, jointly trained with an NER system, yield significantimprovements in NER for Chinese social media. In our experiments, jointlytraining NER and word segmentation with an LSTM-CRF model yields nearly 5%absolute improvement over previously published results.
机译:命名实体识别和其他信息提取任务经常使用语言功能,例如语音标签或分块的一部分。对于在文本中不容易识别单词边界的语言,分词是生成NER系统功能的关键的第一步。虽然使用词边界标签作为功能很有帮助,但有助于识别这些边界的信号可能会为NER系统提供更丰富的信息。最新的分词系统使用神经模型来学习用于预测词边界的表示形式。我们证明,这些相同的表示法与NER系统共同训练,对中国社交媒体的NER产生了重大改进。在我们的实验中,与LSTM-CRF模型联合训练NER和分词可以比以前发表的结果产生近5%的绝对改善。

著录项

  • 作者

    Peng, Nanyun; Dredze, Mark;

  • 作者单位
  • 年度 2017
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号